DivFusion

对输入逐元素做除法运算,并对实数类型结果应用 ReLU激活。

\[\text{对于实数类型:}\quad output_i = \max\left(\frac{input0_i}{input1_i}, 0\right)\]
\[\text{对于复数类型:}\quad output_i = \frac{input0_i}{input1_i}\]
输入:
  • input0 - 被除数输入数据地址。

  • input1 - 除数输入数据地址。

  • length - 计算长度。

  • core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。

输出:
  • output - 计算结果地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持 int8, int16, int32, fp32, fp64, cplx64, cplx128

  • MT7004 支持 fp16, fp32, int16, int32, cplx64

  • 对于复数类型(cplx64 / cplx128)不应用 ReLU,仅返回复数除法结果。

  • 若除数元素为 0,结果为 Inf/NaN 或未定义,需由上层处理。

共享存储版本:

void i8_div_fusion_s(int8_t *input0, int8_t *input1, int8_t *output, int length, int core_mask)
void i16_div_fusion_s(int16_t *input0, int16_t *input1, int16_t *output, int length, int core_mask)
void i32_div_fusion_s(int32_t *input0, int32_t *input1, int32_t *output, int length, int core_mask)
void hp_div_fusion_s(half *input0, half *input1, half *output, int length, int core_mask)
void fp_div_fusion_s(float *input0, float *input1, float *output, int length, int core_mask)
void dp_div_fusion_s(double *input0, double *input1, double *output, int length, int core_mask)
void c64_div_fusion_s(float *input0, float *input1, float *output, int length, int core_mask)
void c128_div_fusion_s(double *input0, double *input1, double *output, int length, int core_mask)

C调用示例:

 1//FT78NE示例(共享存储)
 2#include <stdio.h>
 3
 4int main(int argc, char* argv[]) {
 5    float *input0 = (float *)0xA0000000;   // input0 在 DDR 空间
 6    float *input1 = (float *)0xA1000000;   // input1 在 DDR 空间
 7    float *output = (float *)0xB0000000;   // 输出在 DDR 空间
 8    int length = 1024;
 9    int core_mask = 0xff;
10    fp_div_fusion_s(input0, input1, output, length, core_mask);
11    return 0;
12}

私有存储版本:

void i8_div_fusion_p(int8_t *input0, int8_t *input1, int8_t *output, int length)
void i16_div_fusion_p(int16_t *input0, int16_t *input1, int16_t *output, int length)
void i32_div_fusion_p(int32_t *input0, int32_t *input1, int32_t *output, int length)
void hp_div_fusion_p(half *input0, half *input1, half *output, int length)
void fp_div_fusion_p(float *input0, float *input1, float *output, int length)
void dp_div_fusion_p(double *input0, double *input1, double *output, int length)
void c64_div_fusion_p(float *input0, float *input1, float *output, int length)
void c128_div_fusion_p(double *input0, double *input1, double *output, int length)

C调用示例:

 1//MT7004 示例
 2#include <stdio.h>
 3
 4int main(int argc, char* argv[]) {
 5    float *input0 = (float *)0x10000000;
 6    float *input1 = (float *)0x10001000;
 7    float *output = (float *)0x10002000;
 8    int length = 1024;
 9    fp_div_fusion_p(input0, input1, output, length);
10    return 0;
11}